AI资讯新闻榜单内容搜索-LLaMA

刚刚，开源大模型的新王诞生了：超越GPT-4o，模型还能自动纠错

快速更迭的开源大模型领域，又出现了新王：Reflection 70B。横扫 MMLU、MATH、IFEval、GSM8K，在每项基准测试上都超过了 GPT-4o，还击败了 405B 的 Llama 3.1。这个新模型 Reflection 70B，来自 AI 写作初创公司 HyperWrite。

来自主题: AI资讯

8872 点击 2024-09-06 16:36

今天一大早，Meta 便秀了一把「Llama 系列模型在开源领域取得的成绩」，包括如下：

来自主题: AI资讯

7082 点击 2024-08-31 10:21

最近，Meta的多个工程团队联合发表了一篇论文，描述了在引入基于GPU的分布式训练时，他们如何为其「量身定制」专用的数据中心网络。

来自主题: AI技术研报

9744 点击 2024-08-29 16:10

Meta的开源大模型Llama 3在市场上遇冷，进一步加剧了大模型开源与闭源之争的关注热度。

来自主题: AI资讯

11333 点击 2024-08-27 14:08

随着LLM不断迭代，偏好和评估数据中大量的人工标注逐渐成为模型扩展的显著障碍之一。Meta FAIR的团队最近提出了一种使用迭代式方法「自学成才」的评估模型训练方法，让70B参数的Llama-3-Instruct模型分数超过了Llama 3.1-405B。

来自主题: AI资讯

6485 点击 2024-08-26 09:52

Meta加强推广Llama模型，谋求AI市场领导

来自主题: AI资讯

8638 点击 2024-08-23 10:10

微软Phi 3.5系列上新了！mini模型小而更美，MoE模型首次亮相，vision模型专注多模态。

来自主题: AI技术研报

6730 点击 2024-08-21 18:14

小模型崛起了。

来自主题: AI资讯

11816 点击 2024-08-16 21:04

发布40天后，最强开源模型Llama 3.1 405B等来了微调版本的发布。但不是来自Meta，而是一个专注于开放模型的神秘初创Nous Research。

来自主题: AI技术研报

7399 点击 2024-08-16 14:49

最近的论文表明，LLM等生成模型可以通过搜索来扩展，并实现非常显著的性能提升。另一个复现实验也发现，让参数量仅8B的Llama 3.1模型搜索100次，即可在Python代码生成任务上达到GPT-4o同等水平。

来自主题: AI技术研报

9932 点击 2024-08-15 16:05